草庐IT

Python 从文件中读取并保存到 utf-8

全部标签

Ruby,将字符串与 UTF-8 字符进行比较时出现问题

我有这2个UTF-8字符串:a="N\u01b0\u0303"b="N\u1eef"它们看起来很不一样,但渲染后是一样的:irb(main):039:0>puts"#{a}-#{b}"Nữ-Nữa版本是我存储在数据库中的版本。b版本是来自浏览器的POST请求,我不知道为什么浏览器会发送不同的UTF8字符组合,而且这种情况并不总是发生,我不能'在我的开发环境中重现该问题,它发生在生产环境中并且占总请求的百分比。情况是我尝试比较它们,但它们返回false:irb(main):035:0>a==b=>false我尝试过不同的方法,例如强制编码:irb(main):022:0>c.force

ruby - 即时读取压缩的 csv 文件

我已经写了一些csv文件并压缩它,使用这个代码:arr=(0...2**16).to_aFile.open('file.bz2','wb')do|f|writer=Bzip2::Writer.newfCSV(writer)do|csv|(2**16).times{csv我想阅读这个csvbzip2ed文件(用bzip2压缩的csv文件)。这些未压缩的文件如下所示:1,24,125,28,71,3...所以我尝试了这段代码:Bzip2::Reader.open(filename)do|bzip2|CSV.foreach(bzip2)do|row|putsrow.inspectendend

Ruby 1.9 和 Sass 编码问题。 (从 ASCII-8BIT 到 UTF-8)

我最近升级到Ruby1.9,我不能再用Sass编译任何东西。我见过说明我是否放置的解决方案@charset"utf-8";在我的.sccs文件的顶部,它会修复它。但是我仍然遇到错误。这是完整的回溯我也试过从我的CSS文件中删除任何非ascii字符,创建一个新字符等。它就是无法编译。有什么建议吗?回溯:Sassiswatchingforchanges.PressCtrl-Ctostop./home/webdev/.gem/repository/gems/sass-3.1.1/lib/sass/util.rb:496:in`encode':transcodingnotsupported(f

ruby-on-rails - 如何为 UTF-8 字符串编写带有大引号的 gsub?

我正在为String类编写一个扩展方法来清理非ASCII字符。我正在清理的字符串是UTF-8。当在文件中使用非ASCII字符时,控制台不会启动,因为它将弯引号解释为常规引号。如何转义gsub中的大引号?如何编写将unicode用于大引号(例如U+201C)的gsub。使用Rails3.07和Ruby1.9.2。 最佳答案 您可以在正则表达式中使用与在双引号字符串中使用的相同的\u转义符:s.gsub(/[\u201c\u201d]/,'"')例如:>>s="\u201Cpancakes\u201d"=>"“pancakes”">>p

Ruby - 读取 zip 文件中的文本文件的最简单方法

在Ruby中读取zip文件中的文本文件的最简单方法是什么?类似于PHP的file_get_contents("zip://archive.zip#article.txt") 最佳答案 require'zip/zip'Zip::ZipFile.new("archive.zip").read("article.txt") 关于Ruby-读取zip文件中的文本文件的最简单方法,我们在StackOverflow上找到一个类似的问题: https://stackover

ruby 1.9 + sinatra 不兼容的字符编码 : ASCII-8BIT and UTF-8

我正在尝试将sinatra应用程序迁移到ruby​​1.9我正在使用sinatra1.0、rack1.2.0和erb模板当我启动sinatra时它可以工作,但是当我从浏览器请求网页时出现此错误:Encoding::CompatibilityErrorat/incompatiblecharacterencodings:ASCII-8BITandUTF-8所有.rb文件都有这个标题:#!/usr/bin/envruby#encoding:utf-8我认为问题出在erb文件中,即使它显示它是UTF-8编码[user@localhostviews]$filehome.erbhome.erb:U

ruby-on-rails - 使用 Ruby 从文本中删除硬换行符

我有一些带有硬换行符的文本,如下所示:Thisshouldallbeononelinesinceit'sonesentence.Thisisanewparagraphthatshouldbeseparate.我想删除单个换行符但保留双换行符,所以它看起来像这样:Thisshouldallbeononelinesinceit'sonesentence.Thisisanewparagraphthatshouldbeseparate.是否有一个正则表达式可以做到这一点?(或一些简单的方法)到目前为止,这是我唯一可行但感觉很老套的解决方案。txt=txt.gsub(/(\r\n|\n|\r)/

ruby - 如何通过 http 使用 Ruby 访问 URL 并读取输出?

到目前为止,我已经能够将它们拼接在一起:)beginopen("http://www.somemain.com/"+path+"/"+blah)rescueOpenURI::HTTPError@failure+=painting.permalinkelse@success+=painting.permalinkend但是我如何读取我要调用的服务的输出呢? 最佳答案 Open-URI扩展了open,因此您将获得一种返回的IO流:open('http://www.example.com')#=>#你必须阅读它才能获得内容:open('h

ruby - 从 yaml 文件中读取数据并在 ruby​​ 中生成一个数组

我在yaml文件中有以下数据-----:Subject_listSubject1::Act1:A:Act2:BSubject2::Skill1::Act1:B:Act2:B:Skill2::Act1:B我需要从这个文件中读取数据并生成如下所示的输出-对于主题1,它将是这样的,因为它没有技能水平。表示数组的第一个元素为空。["","Act1","A"],["","Act2","B"]第二个主题是这样的——["Skill1","Act1","B"],["","Act2""B"],["Skill2","Act1","B"]我正在使用这些值生成一个prawnpdf表。任何帮助是极大的赞赏。我试

ruby-on-rails - 编码::UndefinedConversionError: "\xC2"从 ASCII-8BIT 到 UTF-8

我在保存新联系人时收到以下错误。有没有办法强制转换"\xC2"以将其强制保存为UTF-8格式?c=Contact.newc.save!Encoding::UndefinedConversionError:"\xC2"fromASCII-8BITtoUTF-8:INSERTINTO"contacts"("body","created_at","email","updated_at")VALUES(?,?,?,?) 最佳答案 您的字符串采用其他编码,最有可能是iso-8859-1,因此您应该运行此命令来转换它:"\xC2".encode